Roteiro 05 de Outubro de 2012 


a 


- Acessar a base de paridade disponível em 


https://dl.dropbox.com/u/24941619/data paridade.arff 

Definir split = 50% 

Aplicar o k-nn (3,5,9) 

A acurácia melhorou ou piorou com a variação dos valores de K? Por que você acha que isso 
aconteceu? 


Acesse o conjunto de dados Wine Quality a partir da página da UCI: 
http://archive.ics.uci.edu/ml/datasets/Wine+Quality 

Salvar os arquivos winequality-red.csv e winequality-white.csv 

Em cada arquivo, substituir todas as ocorrências de “;” por “,” usando algum editor de texto. 
Fazer para os dois arquivos: 

Aplicar o k-nn (13) e anotar o erro médio quadrático. 

Aplicar o filtro weka.attributeSelection.CfsSubsetEval. 

Anotar ao atributos que foram removidos 

Aplicar o k-nn (13) e anotar o erro médio quadrático. 

Testar o k-nn (13) para os atributos removidos. Anotar o erro médio quadrático. 

Em qual dos testes obteve-se o maior valor do erro médio quadrático? Discuta a influência 
da seleção de atributos nesse conjunto de dados. 


Ri e 


Repetir o ítem 8, usando a rede neural MLP (weka.classifiers.functions.MultilayerPerceptron) 
em vez do knn. 


